python main.py --task CartPole-v1 --agent dqn --epoch 10 --step-per-epoch 5000 --linear-sizes 128 64
python main.py --ril --task CartPole-v1 --agent dqn --epoch 10 --step-per-epoch 5000 --ril-den 200 --linear-sizes 128 64
python main.py --task CartPole-v1 --agent ddqn --epoch 10 --step-per-epoch 5000 --linear-sizes 128 64
python main.py --ril --task CartPole-v1 --agent ddqn --epoch 10 --step-per-epoch 5000 --ril-den 200 --linear-sizes 128 64
python main.py --task CartPole-v1 --agent 'dueling dqn' --epoch 10 --step-per-epoch 5000 --linear-sizes 128
python main.py --ril --task CartPole-v1 --agent 'dueling dqn' --epoch 10 --step-per-epoch 5000 --ril-den 200 --linear-sizes 128
python main.py --task CartPole-v1 --agent pg --epoch 10 --step-per-epoch 5000 --linear-sizes 128 64
python main.py --ril --task CartPole-v1 --agent pg --epoch 10 --step-per-epoch 5000 --ril-den 200 --linear-sizes 128 64
python main.py --task CartPole-v1 --agent 'discrete sac' --epoch 10 --step-per-epoch 5000 --linear-sizes 128 64
python main.py --ril --task CartPole-v1 --agent 'discrete sac' --epoch 10 --step-per-epoch 5000 --ril-den 200 --linear-sizes 128 64
python main.py --task CartPole-v0 --agent a2c --epoch 10 --step-per-epoch 5000 --linear-sizes 128 128 128 0 --lr 3e-4 --seed 1 --gamma 0.9 --batch-size 64 --step-per-collect 8 --episode-per-collect 8 --repeat-per-collect 1
python main.py --task CartPole-v0 --agent a2c --ril --ril-den 200 --epoch 10 --step-per-epoch 5000 --linear-sizes 128 128 128 0 --lr 3e-4 --seed 1 --gamma 0.9 --batch-size 64 --step-per-collect 8 --episode-per-collect 8 --repeat-per-collect 1
python main.py --task CartPole-v0 --agent ppo --epoch 10 --step-per-epoch 5000 --linear-sizes 64 64 0 --lr 1e-3 --batch-size 64 --episode-per-collect 20 --ent-coef 0 --rew-norm
python main.py --task CartPole-v0 --agent ppo --ril --ril-den 200 --epoch 10 --step-per-epoch 5000 --linear-sizes 64 64 0 --lr 1e-3 --batch-size 64 --episode-per-collect 20 --ent-coef 0 --rew-norm
